在去年的這個時候,我參加了2022年的iThome鐵人賽,起初的原因是想要找一個平台來儲存個人筆記並與他人分享。雖然在比賽中我取得了佳作的成績,但我認為那時的我只是個小菜鳥,沒有辦法很好得傳遞我的想法。
經過一年的訓練,我現在已經準備出版人生中的第一本書了。因此今年我打算在30天內將我在這一年中所學到的所有知識和工具都濃縮在一起,而這個主題就是自然語言處理(Natural Language Processing, NLP)
。
人工智慧的熱潮近年來不斷上升,而ChatGPT則是其中最受討論和關注的議題之一,其優秀的語言生成和對話能力使其能夠進行各種形式的自然語言交互,因此在多個領域都有廣泛的應用。不過大部分的人的認知僅限於此而已,而我在這30天的目的就是要讓你們從頭學習這些NLP的技術
,並且通過1~3天一個專案的方式,來逐步帶領你如何撰寫有關於這些人工智慧的程式碼。
Embedding
讀懂文字Pandas
處理資料的方式Pytorch
程式碼與對應的理論TorchText
的使用時機與案例DNN
、RNN
、LSTM
用於自然語言處理Transformer
的強大之處與實作BERT
、T5
、GPT
等應用與實作GPT
家族介紹與ChatGPT
的正確使用方式在接下來的30天,我將詳細地教導你這些熱門語言模型的原理與概念,並在每個專案中逐步向你介紹分析這些語言模型的方法,例如:Attention可視化
、Embedding可視化
、文字關聯性分析
...等技術。
這樣做的目的是讓你逐漸理解在自然語言處理中常用的技術在實際應用方面的用途,並藉此在未來的發展中更好地應用這些技術。
在這30天的學習過程中,你不僅僅只會學到理論知識,還會通過撰寫程式碼的實作方式,來讓你打造最紮實的基礎。
在這次的內容中不會從Python基礎語法開始學習,而是從人工智慧的理論開始。而這些NLP分析工具或函式庫,我將在後續的幾天中逐步教你安裝並指導如何查看它們的官方文件,以確保你能夠按照本文進行學習,而不受這些網站更新的影響。
如果你對其他領域有興趣,或者是一個對程式沒有基礎的人,你可以到我的GitHub上觀看我今年出版的書籍所包含的程式碼,這些程式碼可以幫助你理解這些領域的概念!
當然如果有問題也歡迎詢問,畢竟在學習的路上需要互相幫助才能共同進步。那麼我們明天再見!